大数据行业:独角兽爆发元年丨2016逐鹿盘点
伴随着数据量增长,全社会信息化提升,大数据行业进入了普及期。
大数据行业目前规模达200-300亿,年化增速50%以上。
大数据行业中的企业,可以分成数据源提供,基础设施和应用三个类别。
对于大数据应用企业,其模式主要是基于外部数据的DaaS模式和为企业提供内部数据梳理的PT模式。
目前相对较成熟的PT模式中,还是以面向大企业客户为主。
2016年,有近10家大数据企业获得超过1亿人民币的融资,达到10亿人民币估值的本土“独角兽”门槛。16年是“大数据独角兽元年”。
2017年,我们认为大数据行业会有以下的变化:
1. 大企业客户逐渐接受SaaS服务;
2. 大数据行业将呈现纵向整合的趋势;
3. 非结构化数据分析企业开始爆发;
4. 大数据变现方式开始多样化;
5. 二级市场开始追捧大数据概念。
根据定义的不同,大数据行业的市场规模在数百亿左右。
▲ 数据来源: 36氪 36kr.com
虽然当前市场规模并不庞大,但其极高增速却备受瞩目。这个市场,归根结底可以总结为互联网、信息化和硬件性能上升所带来的结构性机会。大数据的“大”,可以从以下几个方面来看:
1. 企业信息化程度提高,移动互联网渗透,IOT等数据源的产生渠道在越来越多样化,因此数据量在飞速提升。
2. 硬件价格下降,性能上升,使得大规模的数据存储和处理在成本上变为可能。亚马逊首席执行官贝索斯提出了一个“贝索斯定律”,那就是“每隔3年云计算单位计算能力的价格将下降50%”。
3. 以google,amazon为代表的互联网企业研发出了有效的海量数据高响应存储方案,使得管理大量数据在软件层面成为可能。
▲ 图片来源:网络
4. 互联网带宽的增加,使得大量数据的传输与集中存储成为可能。也带来了云计算(数据源分散,存储和计算集中)的蓬勃发展。
▲ 数据来源:网络
从技术普及曲线来看,大数据从2008年概念产生到现在,刚好处于普及前夕,度过了2014年的泡沫期。
▲ 图片来源:新浪微博
目前不同机构整理的中国大数据图谱也已经很多了,简单统计下,号称在做大数据的公司全国有数千家之多。
▲ 数据来源:Analysys www.analysys.cn
▲ 来源:首席数据观联盟
我们看大数据行业,是把大数据行业和其支撑产业结合在一起作为一个整体来考虑。
我们把大数据行业,按照数据源,基础架构和真正的大数据应用做了一个分类。而大数据应用之中,又分为行业垂直型服务和通用型服务。从数据源的角度,以结构化、非结构化,外部、内部可以将大数据应用分为4个象限。
目前结构化数据仍然占据压倒性优势,主要是因为非结构化数据解析所需的技术还尚未成熟,较难提取出有效信息。但在未来,这是值得去深入挖掘的数据蓝海,而外部数据和内部数据,又可以概括成目前最常见的2种商业模式。
1. 依托收集外部数据,经加工后提供信息服务的“DaaS模式”。
这种模式的代表如IT桔子,企名片,天眼查等。通常都是依靠抓取,或者购买外部的数据源,经过全自动或者半自动的整理,输出成更加易用的数据。
其优势在于:产品化程度相当高,不存在着针对个别企业的定制开发和部署,因而毛利高,边际成本极低,商业模式比较类似互联网服务。
但相对的,其劣势在于:数据源缺乏壁垒(通过灰色手段获取的数据源,也面临今后合规的风险),企业付费意愿较低。所以DaaS模式的企业目前大多数都还缺乏合理可持续的收入和盈利能力。
我们认为,目前这个领域创业的关键还是在于数据源的价值和门槛上。下面举3个例子来分析:
目前国内做得好的企业,当属Wind这样的金融信息服务企业。因为金融机构对于信息的需求是刚需,Wind这样的机构就有了充沛的需求。
同样,依靠接入的企业越多,反欺诈黑名单越有效的同盾,也有着很有价值的数据,和自我循环强化的数据源壁垒。
业内也有一批通过运营商关系,将运营商手上的个人数据(个人信息识别,电话号码等)以某种方式作为销售线索提供的公司。
总而言之,要通过“DaaS”模式成功收费,企业需要思考自己的数据到底是否真的是客户的刚需,能否产生价值,以及如何建立数据源的门槛和壁垒。
整体而言,这类企业的业务形态更加类似我们熟知的传统互联网企业,而不那么类似强BD驱动的“企业服务类”企业。
2. 为企业内部数据做整理,分析,展示,挖掘的”PT(Palantir&Tableau)模式。
整体而言,企业内部数据服务的商业模式更加类似于我们熟知的“企业服务”类企业,更多的依靠BD驱动去一家家的开拓客户。
在大多数DaaS模式的企业还在苦苦摸索变现方式的时候,PT模式的行业领先企业已经可以做到年收入上亿,订单额数亿,整体发展状态相对较好。而即便起步晚的企业,也基本可以做到收入稳步上升,实现盈亏平衡。
我们对目前较知名的”PT模式”企业,做了一个简单的分类。纵轴是轻量级,重量级,横轴是SaaS模式/On-premise模式。
轻量级/重量级主要的差异在于:该内部数据服务是否需要对企业的全部数据进行归总,处理,甚至重新设计数据结构并存储。Palantir属于重量级的代表,需要对企业分散在各处的数据进行归总和整理,其提供的强大分析功能,也需要重新设计特定的数据结构做支撑。目前国内这个领域的代表性公司是明略数据,海云数据。除此之外也有做金融行业的贝格大数据和初创公司杉树科技等等。
重量级的服务,其客户往往都是顶级的企业和政府,单笔的订单金额可以从几百万到上千万不等。实际的工作性质,会非常接近数据平台的重新搭建,需要企业有较强的BD能力和工程能力。其优势是单笔订单金额大,容易做出一定的收入规模,劣势是由于部署实施占比较多,而且较难产品化,毛利率会比较接近系统集成商。
而轻量级的服务,比如国内的永洪科技,只需要连接公司既存的数据库,进行数据可视化,在部署周期和削减定制化方面有较大的优势。但是其劣势在于,服务的技术门槛相对重量级服务会偏低。对于企业而言,也往往不作为核心生产系统的一部分来使用,客户也相对较易流失。
至于SaaS/On premise的路线选择,在今天的中国,更像是在问选择大企业还是中小企业作为客户。国内目前大数据服务的潜在客户群体,是除互联网外的大型政府部门/企业(互联网巨头往往具备极强的IT能力,会自行建设),和中小企业。尽管大客户对于公有云的接受程度在不断提高,但到目前为止中国电信,工商银行,中石油这样的大客户还是对数据安全非常重视,而且招标流程也只适应on-premise/私有云模式。所以选择有较强付费能力的传统大企业作为客户,则模式必然要倾向于on-premise。
反之,如果客户群体主要是互联网企业/中小企业,或者一部分大型企业的非核心系统,则往往会采用SaaS模式来进行销售。客单价相比大型企业的数百万,会降低到10万以内,但是售前和部署部分的成本可以节约,毛利率会相对较高。但是这种模式的弊端在于,他同样无法解决分享逍客遭遇的问题—较低的客单价没法覆盖销售成本。
2016年,大数据行业发生了多起融资额过亿的大额融资。有一批企业的估值也已经到达了10亿人民币的“本土独角兽”水平。所以2016年,我们认为是大数据企业的“独角兽元年”。
针对2017年,我们认为有以下的一些趋势值得关注:
1.大企业客户逐渐接受SaaS服务
随着云计算的普及和落地,有越来越多的大企业在建设自己的私有云。预计17年,会有更多的服务以SaaS的形态部署在私有云上。也有一批大企业会首先在非核心业务领域尝试公有云SaaS服务。
这意味着尽管目前需要on-premise模式去部署来迎合客户的需求,未来所有企业都应该有意识的将企业客户向SaaS版本转化。
2.大数据行业的纵向整合
首先成长起来的一批大数据企业,如Testin,Talkingdata等,为了增加自己的竞争门槛和拓宽收费深度,可能会进行行业的纵向整合。
3.非结构化数据分析企业开始爆发
非结构化数据分析,尽管目前还较难得到客户对其价值的认可,明年会崭露头角。有一批企业如一面科技,Taste analytics会获得较多的订单,收入可以实现3-5倍的增长。
4.大数据变现方式开始多样化
目前大数据应用的变现方式,还是脱离不了DaaS模式的直接卖数据或者PT模式的卖服务/产品。但17年,应该会看到大数据在金融征信,健康,交通,农业等领域有更加实际的应用,并且实现交易分成,按照效果付费等多样化的变现方式。
5.二级市场开始追捧大数据概念
虽然在境内A股市场大数据已经热了几年,但是真真切切的并购案例,目前仍然不算多。我们预计明年会有更多的传统企业通过并购切入大数据行业。支撑大数据的“新IT架构”,比如私有云,新形态存储,新形态CDN等基础设施也会被打上大数据的标签,收到上市公司的并购邀约。
本文作者那小川,华兴资本逐鹿X融资总监。
曾经任职于东京罗兰贝格、也曾担任DeNA CEO Office战略分析师,在职期间为多家世界500强企业和并购PE服务。曾协助E汇,泰丰金融,店小秘,马帮,懒投资,Feel,iclick,抱抱直播等企业完成融资/老股收购/拆除VIE等资本运作。如有任何问题欢迎在文末留言或者私信与作者交流:Harryna@zhulux.com。
- 他的更多分析文章 -